Un investigador estudió los ritmos biológicos en ratones para analizar el efecto del fármaco Probenecid en la reducción de peso (Morgan 2018). Cada mañana, el investigador registró el momento en que los ratones despertaron y comenzaron sus actividades. Este evento ocurrió entre las 5:35 y las 6:10 de la mañana. Si asume que la distribución de este evento es uniforme en ese rango de tiempo:
La función de densidad describe la probabilidad relativa de una variable continua. Por lo tanto, debemos asumir que el tiempo de actividad de los ratoncitos es continuo. Para graficar esta función se puede usar la biblioteca ggplot2. Los valores extremos del rango (a,b ) pueden estar definidos en horas, minutos u otra unidad que usted estime conveniente. Si utilizamos horas, el gráfico será el siguiente:
a = 5.6
b = 6.2
x = seq(a, b, by=0.01)
y = 1/(b-a)
datos = data.frame(hours = x, f_x = y)
grafico = ggplot(datos, aes(x, y))
grafico = grafico + theme_bw()
grafico = grafico + ylab("Densidad") + xlab("Horas")
grafico = grafico + ggtitle("Densidad de Probabilidad")
grafico = grafico + geom_density(fill = "navajowhite", color = "orange3", linewidth = 0.1)
ggplotly(grafico)
La función de masa describe la probabilidad relativa de una variable discreta. Por lo tanto, debemos asumir que el tiempo de actividad es discreto. Para graficar esta función se puede usar nuevamente la biblioteca ggplot2.
x= seq(a,b,by=0.01)
y = 1/length(x)
grafico = ggplot(data=datos,aes(x=x,y=y))
grafico = grafico + geom_bar(stat="identity",fill="navajowhite",color="orange3", size = 0.1)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
grafico = grafico + theme_bw() + ggtitle("Masa de probabilidades")
grafico = grafico + xlab("Horas") + ylab("Masa") + coord_cartesian(ylim=c(0, 0.02))
ggplotly(grafico)
Con relación a las medidas solicitadas, su cálculo depende si consideramos el tiempo de actividad de los ratoncitos una variable continua o discreta. En el caso de continua será:
media = (a+b)/2
desviacion = round(sqrt(((b-a)^2)/12),3)
print(paste(media,"±",desviacion))
## [1] "5.9 ± 0.173"
en caso de ser una variable discreta sera:
media = (a+b)/2
desviacion = round(sqrt(((b-a+1)^2+1)/12),3)
print(paste(media,"±",desviacion))
## [1] "5.9 ± 0.545"
Un estudio ha señalado que en el Hospital de Medellín hubo 292 accidentes laborales entre los años 2015 y 2019 (Pérez-Correa 2022).
Como se ocupa la metrica de tiempo se ocupa la distribución poisson
lambda_dia = 292/(5*365)
prob_dia = dpois(0, lambda_dia)
print(prob_dia)
## [1] 0.8521438
lambda_semana = 292/(5*52)
prob_semana = dpois(2, lambda_semana)
print(prob_semana)
## [1] 0.2051365
accidentes=seq(0,10)
distribucion = dpois(accidentes,lambda_dia)
datos=data.frame(accidentes,distribucion)
grafico = ggplot(data=datos,aes(x=accidentes,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="navajowhite",color="orange3", size = 0.1)
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades - Poisson")
grafico = grafico + xlab("Número de accidentes x día") + ylab("Probabilidad")
ggplotly(grafico)
accidentes=seq(0,10)
distribucion = dpois(accidentes,lambda_semana)
datos=data.frame(accidentes,distribucion)
grafico = ggplot(data=datos,aes(x=accidentes,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="navajowhite",color="orange3", size = 0.1)
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades - Poisson")
grafico = grafico + xlab("Número de accidentes x semana") + ylab("Probabilidad")
ggplotly(grafico)
Un investigador está utilizando un Modelo de Regresión de Cox para explicar una variable fisiológica causante de una enfermedad (Rivas 2006). Este modelo requiere la estimación de cuatro parámetros en un rango de 0 a 100: una constante base (mantisa) y tres asociados a un exponente. Para llevar a cabo la estimación, el investigador ha dividido cada variable en 10 intervalos.
como se tienen 4 variables y ambas con 10 intervalos las posibles combinaciones son:
combinaciones = 10^4
print(combinaciones)
## [1] 10000
Como se tarda 1 min en ser evaluado puede se tiene:
horas = combinaciones/60
print(horas)
## [1] 166.6667
Le toma alrededor de 167 horas lo que es mucho
Dado que las variables siguen una distribución normal de media 50 y desviación estándar 10. La probabilidad de que las variables tengan un valor entre 40 y 60 es:
probabilidad = round(pnorm(60,50,10)-pnorm(40,50,10),2)
print(probabilidad)
## [1] 0.68
Esto hace que la probabilidad de que los mejores parámetros estén entre 40 y 60 sea casi del 70%. Por lo tanto, le sugeriría al investigador acotar la búsqueda a este rango. Esto hace que el número de combinaciones sea 34=81 y tarde aproximadamente 1 hora 30 minutos.
Si tiene más tiempo, podría llevar el rango de 30 y 70, que tiene casi del 95% de probabilidad. Esto hace que el número de combinaciones sea 34=625 y tarde aproximadamente 10 horas.
probabilidad = round(pnorm(70,50,10)-pnorm(30,50,10),2)
print(probabilidad)
## [1] 0.95